Stan badań na 2022-06-30
Łącznie wpisy na mapę dzikich wysypisk przesłały 54 osoby.
Wszystkie nazwy ochotników ujednoliciłem do małych liter. Usunąłem spacje na początku i na końcu nazw. To pozwoliło liczyć nazwy wpisane np. “sebastian33444” i “Sebastian33444” jako to samo.
Nazwy moje (Remka) są dwie: Rmo i Uffo7. Wcześniej korzystałem z Uffo7, potem na potrzeby nagrywania instrukcji wymyśliłem inną nazwę aby pokazać w formularzu ścieżkę przesyłania wpisu po raz pierwszy.
| volunteer_id | n |
|---|---|
| katarzyna wasilewska | 16 |
| pkrupnik | 15 |
| rmo | 15 |
| hpruszyn | 14 |
| alex1313 | 13 |
| email_dzikiewysypiska | 11 |
| kraterek | 9 |
| ktk | 8 |
| anna_krzynowek | 5 |
| darkerone | 5 |
| langel | 5 |
| uffo7 | 4 |
| kolija | 3 |
| quks | 3 |
| radkel | 3 |
| taranah | 3 |
| twardy | 3 |
| zwiedzamłódź | 3 |
| alex | 2 |
| efem | 2 |
| gargl | 2 |
| jul_woj | 2 |
| maciej | 2 |
| ms1996 | 2 |
| radosław antosik | 2 |
| sebastian33444 | 2 |
| tooomasz | 2 |
| ainka | 1 |
| alexxx19 | 1 |
| atom | 1 |
| bogusia | 1 |
| dim79 | 1 |
| ezamar | 1 |
| j13 | 1 |
| jerzy1956 | 1 |
| jmp | 1 |
| juha | 1 |
| juliaróża | 1 |
| juliaz | 1 |
| kacperka1 | 1 |
| kasia chojnacka | 1 |
| katarzyna | 1 |
| magpas | 1 |
| małgo | 1 |
| małgorzata | 1 |
| nittka969 | 1 |
| noyes | 1 |
| nukazet | 1 |
| ps | 1 |
| romek1076 | 1 |
| sejti | 1 |
| sierra | 1 |
| tomektramwaj | 1 |
| ula urszula | 1 |
Mamy dużo osób, które zrobiły mało wpisów, a mało takich które zrobiły dużo.
To jest też typowe np. w użytkowaniu mediów społecznościowych (mało osób ma wysoką aktywność a dużą ma małą).
| liczba_wpis | liczba_ochotnik |
|---|---|
| 1 | 27 |
| 2 | 9 |
| 3 | 6 |
| 4 | 1 |
| 5 | 3 |
| 8 | 1 |
| 9 | 1 |
| 11 | 1 |
| 13 | 1 |
| 14 | 1 |
| 15 | 2 |
| 16 | 1 |
Zobaczymy jeszcze, czy ilość wpisów jest powiązana z tym, jak długo ochotnik jest z nami. Biorę datę zatwierdzaną przez ochotnika.
Liczę różnicę dat jako ostatnia_data - pierwsza_data + 1. Czyli 1 dzień oznacza, że ochotnik przesłał wpisy tylko jednego dnia.
| volunteer_id | liczba_wpis | pierwszy_ostatni_wpis_ile_dni |
|---|---|---|
| katarzyna wasilewska | 16 | 96 |
| pkrupnik | 15 | 51 |
| rmo | 15 | 57 |
| hpruszyn | 14 | 11 |
| alex1313 | 13 | 16 |
| email_dzikiewysypiska | 11 | 49 |
| kraterek | 9 | 28 |
| ktk | 8 | 101 |
| anna_krzynowek | 5 | 7 |
| darkerone | 5 | 44 |
| langel | 5 | 2 |
| uffo7 | 4 | 28 |
| kolija | 3 | 1 |
| quks | 3 | 1 |
| radkel | 3 | 1 |
| taranah | 3 | 24 |
| twardy | 3 | 2 |
| zwiedzamłódź | 3 | 1 |
| alex | 2 | 26 |
| efem | 2 | 4 |
| gargl | 2 | 19 |
| jul_woj | 2 | 1 |
| maciej | 2 | 19 |
| ms1996 | 2 | 1 |
| radosław antosik | 2 | 1 |
| sebastian33444 | 2 | 37 |
| tooomasz | 2 | 1 |
| ainka | 1 | 1 |
| alexxx19 | 1 | 1 |
| atom | 1 | 1 |
| bogusia | 1 | 1 |
| dim79 | 1 | 1 |
| ezamar | 1 | 1 |
| j13 | 1 | 1 |
| jerzy1956 | 1 | 1 |
| jmp | 1 | 1 |
| juha | 1 | 1 |
| juliaróża | 1 | 1 |
| juliaz | 1 | 1 |
| kacperka1 | 1 | 1 |
| kasia chojnacka | 1 | 1 |
| katarzyna | 1 | 1 |
| magpas | 1 | 1 |
| małgo | 1 | 1 |
| małgorzata | 1 | 1 |
| nittka969 | 1 | 1 |
| noyes | 1 | 1 |
| nukazet | 1 | 1 |
| ps | 1 | 1 |
| romek1076 | 1 | 1 |
| sejti | 1 | 1 |
| sierra | 1 | 1 |
| tomektramwaj | 1 | 1 |
| ula urszula | 1 | 1 |
Na wykresie trochę widać zależność monotoniczną – jak rośnie jedno to drugie też. Jest przy tym dużo pojedynczych wpisów.
Skala logarytmiczna żeby “rozgciągnąć” niskie wartości, których jest większość:
Zobaczmy to z trendem i nazwami ochotników:
Zobaczmy to samo ale tylko dla tych, co mają więcej, niż 1 wpis:
Ci co są dłużej niż 10 dni mają więcej wpisów?
To są nierówne grupy. Tych, co są dłużej mamy znacznie mniej.
## pierwszy_ostatni_wpis_ile_dni > 10
## FALSE TRUE
## 39 15
##
## Spearman's rank correlation rho
##
## data: volunt_difftime$pierwszy_ostatni_wpis_ile_dni and volunt_difftime$liczba_wpis
## S = 5140.3, p-value = 2.453e-13
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.8040663
Korelacja wychodzi 0.8040663 czyli tak, im dłużej ochotnik jest z nami tym ma więcej wpisów.
Może najsensowniej byłoby to policzyć tylko dla osób, mających więcej, niż 1 wpis bo takie z 1 wpisem mają zawsze 1 dzień?
##
## Spearman's rank correlation rho
##
## data: volunt_difftime_1$pierwszy_ostatni_wpis_ile_dni and volunt_difftime_1$liczba_wpis
## S = 1415.2, p-value = 0.001998
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.568
Tutaj współczynnik jest niższy, niż kiedy braliśmy wszystkich.
Jeden punkt na mapie oznacza jeden wpis. Łącznie 172 punkty, 94% z 183 wpisów.
| Podano informację o wysypisku | n | % |
|---|---|---|
| Nie | 133 | 73 |
| Tak | 50 | 27 |
| SUMA | 183 | 100 |
O ile nie wskazano inaczej, cechy wysypisk dotyczą 50 wpisów.
Czy podanie informacji o wysypisku zależy od tego, kto robi wpis? Czy zależy od tego, który jest to kolejny wpis?
Są osoby zawsze wpisujące informacje, są takie, które tego nie robią. Jak to wyjaśnić? Nie wiem, czy mamy coś sensownego w danych na ten temat.
Może sama liczba wpisów?
Nie widzę zależności.
Też nic nie widać.
Jeszcze zobaczymy frakcję “tak” w zależności od pogrupowanej liczby wpisów
##
## FALSE TRUE
## 36 18
## volunteer_id Nie Tak liczba_wpis_sum
## Length:54 Min. : 0.000 Min. :0.0000 Min. : 1.000
## Class :character 1st Qu.: 0.000 1st Qu.:0.0000 1st Qu.: 1.000
## Mode :character Median : 1.000 Median :0.5000 Median : 1.500
## Mean : 2.463 Mean :0.9259 Mean : 3.389
## 3rd Qu.: 2.000 3rd Qu.:1.0000 3rd Qu.: 3.000
## Max. :15.000 Max. :6.0000 Max. :16.000
## frc_tak
## Min. :0.00000
## 1st Qu.:0.00000
## Median :0.03125
## Mean :0.36263
## 3rd Qu.:1.00000
## Max. :1.00000
Nie widzę zależności i jest to mało intuicyjne.
TODO - potraktować wpisy jako sekwencję po dacie, pierwszy, drugi itp. spróbować na tym to sprawdzić
| Jak_oceniasz_powi | Jaki_jest_charakt | Total | ||||
|---|---|---|---|---|---|---|
|
drobne odpady rozproszone |
inne | kilka stosów |
pojedyncze duże gabaryty (np. muszla klozetowa, lodówka) |
zwarty stos odpadów | ||
|
do 5 metrów kwadratowych (m. kw) - mniejsze niż mały pokój |
4 | 2 | 3 | 2 | 5 | 16 |
|
od 51 do 500 m. kw - mieszkanie lub boisko do koszykówki |
6 | 0 | 6 | 1 | 0 | 13 |
|
od 6 do 50 m. kw - pokój lub kilka pokoi |
3 | 3 | 6 | 0 | 2 | 14 |
| trudno powiedzieć | 0 | 0 | 0 | 1 | 0 | 1 |
|
większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie |
0 | 3 | 1 | 1 | 1 | 6 |
| Total | 13 | 8 | 16 | 5 | 8 | 50 | χ2=28.422 · df=16 · Cramer’s V=0.377 · Fisher’s p=0.031 |
Pytanie wielokrotnego wyboru, odpowiedzi nie sumują się do 50 wpisów.
Nikt nie wskazał, że wysypisko jest “niewidoczne (ukryte)”.